Národní úložiště šedé literatury Nalezeno 12 záznamů.  1 - 10další  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Multi-label klasifikace textových dokumentů
Průša, Petr ; Očenášek, Pavel (oponent) ; Bartík, Vladimír (vedoucí práce)
Diplomová práce se zabývá automatickou klasifikací textových dokumentů. Jsou zde vysvětleny základní pojmy a problémy dolování z textu. Práce vysvětluje pojem shlukování a ukazuje několik základních algoritmů shlukování. Je zde ukázáno i několik metod klasifikace a podrobně je rozebrána vybraná metoda matrix regression. Dále byla navrhnuta a implementována aplikace používající ke klasifikaci matrix regression. Provedené experimenty byly zaměřeny na normalizaci a prahování.
Analýza sentimentu s využitím dolování dat
Sychra, Martin ; Burget, Radek (oponent) ; Bartík, Vladimír (vedoucí práce)
Obsahem práce je analýza sentimentu, především z informatického hlediska (okrajově z hlediska lingvistického). V lingvistické části je rozebrán pojem sentiment a jazykové metody pro jeho analýzu, např. lemmatizace, POS tagging, využití seznamu stopwords apod. Větší pozornost je následně věnována struktuře analyzátoru sentimentu, který je založen na některé z metod strojového učení (metoda podpůrných vektorů, naivní Bayesův klasifikátor a klasifikátor maximální entropie). Na základě teoretických východisek je navržen a implementován funkční analyzátor. Experimenty jsou zaměřeny především na porovnání klasifikačních metod a přínos využití jednotlivých metod předzpracování. Úspěšnost sestrojeného klasifikátoru dosahuje až 84 % v křížové validaci.
Odvození slovníku pro nástroj Process Inspector na platformě SharePoint
Pavlín, Václav ; Masařík, Karel (oponent) ; Kreslíková, Jitka (vedoucí práce)
Tato diplomová představuje metody pro dolování důležitých informací z textu. Analyzuje problém extrakce pojmů z rozsáhlé sady dokumentů a popisuje implementaci řešení s využitím jazyka C# a databázového systému Microsoft SQL Server. Systém k extrakci pojmů využívá lemmatizaci výrazů a několik statistických metod. Práce také srovnává použité metody a navrhuje postup odvození slovníku.
Odhad emocí z textu
Dufková, Aneta ; Fajčík, Martin (oponent) ; Szőke, Igor (vedoucí práce)
Tato práce popisuje proces odhadování emocí z textu, při němž je využíváno strojové učení. Proces začíná průzkumem používaných metod, pokračuje výběrem vhodné metody a experimentováním. Využívá několik datových sad, kombinuje je a zkouší různé techniky předzpracování textu. Závěrem je webové rozhraní, které využívá předtrénovaný model a umožňuje detekovat emoce z příspěvků z Twitteru.
Dolování znalostí z textových dat související s migrační krizí
Koukal, Filip
Tato bakalářská práce se zabývá využitím technik strojového učení pro dolování znalostí z textových dat související s migrační krizí. Data představují články a jejich komentáře ze zpravodajského portálu idnes.cz. V rámci práce jsou prozkoumané možnosti modelu Word2Vec pro problematiku dolování znalostí. Bylo navrženo a provedeno několik experimentů pro identifikaci a charakterizaci témat, kterými se autoři článků zabývají.
Získávání skrytých znalostí z online dat souvisejících s vysokými školami
Hlaváč, Jakub
Sociální sítě představují populární formu komunikace. Univerzitám usnadňují poskytování informací a oslovení uchazečů o studium. Trendem je také vzdělávání prostřednictvím zahraničních studijních pobytů. Studenti se však setkávají s řadou překážek. Výsledky této práce mohou pomoci univerzitám efektivněji komunikovat prostřednictvím sociálních sítí a lépe podporovat zahraniční pobyty. V rámci práce byla analyzována data ze sociálních sítí českých univerzit a data z průzkumů organizace Erasmus za účelem nalezení užitečných znalostí. Hlavní pozornost byla věnována zkoumání textových dat. Převážně byly využity statistické metody a metody strojového učení včetně výběru proměnných, modelování témat a shlukování. Výstupem jsou témata, která jsou na sociálních sítích populární a zajímavá. Dále byly identifikovány klíčové problémy studentů při zahraničních pobytech a vybrané z nich byly srovnávány pro země i univerzity.
Odhad emocí z textu
Dufková, Aneta ; Fajčík, Martin (oponent) ; Szőke, Igor (vedoucí práce)
Tato práce popisuje proces odhadování emocí z textu, při němž je využíváno strojové učení. Proces začíná průzkumem používaných metod, pokračuje výběrem vhodné metody a experimentováním. Využívá několik datových sad, kombinuje je a zkouší různé techniky předzpracování textu. Závěrem je webové rozhraní, které využívá předtrénovaný model a umožňuje detekovat emoce z příspěvků z Twitteru.
Multi-label klasifikace textových dokumentů
Průša, Petr ; Očenášek, Pavel (oponent) ; Bartík, Vladimír (vedoucí práce)
Diplomová práce se zabývá automatickou klasifikací textových dokumentů. Jsou zde vysvětleny základní pojmy a problémy dolování z textu. Práce vysvětluje pojem shlukování a ukazuje několik základních algoritmů shlukování. Je zde ukázáno i několik metod klasifikace a podrobně je rozebrána vybraná metoda matrix regression. Dále byla navrhnuta a implementována aplikace používající ke klasifikaci matrix regression. Provedené experimenty byly zaměřeny na normalizaci a prahování.
Analýza sentimentu s využitím dolování dat
Sychra, Martin ; Burget, Radek (oponent) ; Bartík, Vladimír (vedoucí práce)
Obsahem práce je analýza sentimentu, především z informatického hlediska (okrajově z hlediska lingvistického). V lingvistické části je rozebrán pojem sentiment a jazykové metody pro jeho analýzu, např. lemmatizace, POS tagging, využití seznamu stopwords apod. Větší pozornost je následně věnována struktuře analyzátoru sentimentu, který je založen na některé z metod strojového učení (metoda podpůrných vektorů, naivní Bayesův klasifikátor a klasifikátor maximální entropie). Na základě teoretických východisek je navržen a implementován funkční analyzátor. Experimenty jsou zaměřeny především na porovnání klasifikačních metod a přínos využití jednotlivých metod předzpracování. Úspěšnost sestrojeného klasifikátoru dosahuje až 84 % v křížové validaci.
Reprezentace textu a její vliv na kategorizaci
Šabatka, Ondřej ; Chmelař, Petr (oponent) ; Bartík, Vladimír (vedoucí práce)
Diplomová práce se zabývá strojovým zpracováním textových dat. V teoretické části jsou popsány problémy související se zpracováním přirozeného jazyka a dále jsou představeny různé způsoby předzpracování a reprezentace textu. Práce se také blíže věnuje použití N-gramů jako rysů pro reprezentaci dokumentů a popisuje některé algoritmy sloužící pro jejich extrakci. Další část je pak věnována přehledu používaných klasifikačních metod. V rámci praktické části práce byla navržena a implementována aplikace sloužící pro předzpracování a vytváření různých reprezentací textových dat. V rámci experimentů je pak sledován vliv těchto reprezentací na úspěšnost klasifikačních algoritmů.

Národní úložiště šedé literatury : Nalezeno 12 záznamů.   1 - 10další  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.